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(57) Abstract 

A protein having at least 65 % sequence homology with the sequence (I). This protein may particularly be hard wheat or soft wheat 
thioredoxin h. The DNA corresponding to said protein may be integrated into an expression vector for production by microorganisms. 

(57) Abr^^ 

Prot6inc pr6sentant unc similinidc dc sdqucncc d*au moins 65 % avec la sequence (I), Cette prot6inc peut fttre en paiticulier la 
ihioT^oxine h de bl6 dur ou de bl6 tendre. L*ADN conespondant d cette prot6ine peut fttrc int6gr6 dans un vecteur d*expiession en vue de 
sa production par des micro-organismcs. 
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Thioredoxines h de bie tendre et de ble 
dur et proteines presentant des similitudes, 
5 fragments d'ADN codant pour ces proteines 

et procedes d'obtention 

La presente invention a pour objet des 
thioredoxines h de ble tendre et de ble dur^ des 
10 proteines presentant des similitudes ainsi que des 
fragments d'ADN codant pour ces proteines. 

Elle est en outre relative a des procedes 
d'obtention de ces proteines. 

Les thioredoxines sont des proteines de petites 
15 tallies impliquees dans divers processus biologiques 
et vraisemblablement presentes dans tous les 
organismes vivants. 

El les interviennent entre autres comme donneurs 
d'hydrogene pour des reductases (ribonucleotide, 
20 methionine sulfoxyde et sulfate reductase) et comme 
oxydoreductases des fonctlons disulfure de plusieurs 
proteines . Pour les proprietes generales des 
thioredoxines on pourra avantageusement se referer a 
la revue de Pllle (Annales de I'Institut Pasteur, 
25 volume 1, 34-50, 1992) ou de Holmgren (TIBS, Janvier 

1981, 26-29) ♦ 

Si les thioredoxines de bacteries sont bien 
connues, les thioredoxines h des organismes 
superieurs, et en partlculier des plantes ont ete 
30 assez peu etudlees. 

Ainsi, seules les thioredoxines h de tabac 
(Marty et Meyer, Plant Molecular Biology, 17, 143-147, 
1991; Brugidou et al . , Mol Gen Genet , 238, 285-293, 
1993), de riz ( sequ nee EMBL N* D 26547), 
35 d' Arabidopsls thallana ( Rivera-Madrid et al.. Plant 
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Physiol, 102, 327-328/ 1993) et de Chlamydomonas 
relnhardtli (Decottignies et al. Eur. J. Biochem, 198/ 
505-512/ 1991) ont ete a ce jour sequencees. 

Leur sequengage a ete effectue a partir d*ADN 
5 complementaire selectionne dans des banques d'ADN de 
tabac ou d* Arabidopsis thallana par hybridation du 
clone portant I'ADN complementaire codant pour la 
thioredoxine h avec une sonde correspondant a un ADN 
complementaire de la thioredoxine hi de tabac pour 

10 Arabidopsis thaliana { Rivera-Madrid et al. 
precedemment cite)/ c'est-a-dire une sond 
heterologue/ ou aprSs criblage par hybridation 
dif f erentielle (Marty et Meyer, precedemment cites). 

Zhong-Ru Gan (J. Biol. Chem, 1991/ 266 (3)/ 

15 1692-1696) a sequence une thioredoxine de levure. Des 
amorces correspondant a des sequences encadrant le 
site actif de cette thioredoxine ont ete utilis' s 
pour amplifier un fragment de 34 paires de base. Ce 
fragment a alors ete utilise comme sonde dans un 

20 hybridation du type Southern pour le criblage d'une 
banque genomique de levure. 

Muller et Buchanan (J. Biol. Chem. 1989/ 264 
(7)/ 4008-4014) ont quant a eux decrits le clonage 
d'un gene codant pour une thioredoxine m, et non une 

25 thioredoxine h. La strategie utilisee pour le clonage 
consiste a faire une hybridation du type Southern du 
genome de la bacterie Anacystis nidulans/ avec une 
sonde presentant des similitudes avec les sites actifs 
d'autres thioredoxines m puis a doner le fragment 

3 0 correspondant . 

A la connaissance du demand ur, les seul s 
sequences de thioredoxin h de plantes qui etaient 
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publlees, et pouvalent done etre utlllsees comme 
sondes, etaient celles de tabac et de Chlamydomonas 
relnhardtli; c'est-a-dire d*une plante dlcotyledone et 
d'une algue unlcellulaire . 
5 Ces sondes s*hybrldent de maniere heterologue 

avec des ADN complementaires d*autres plantes 
presentant une grande distance evolutive, les mono- 
cotyledones • 

Ainsl, I'homme du metier desireux de 

10 selectionner des clones d'ADN complementaires dans des 
banques de plantes mono-cotyledones etait incite a 
utiliser des sondes heterologues , done peu 
specifigues, et ce d*autant plus qu'excepte le site 
actif , il existe peu de similarite entre les sequences 

15 de thioredoxines h, et induisant ainsi des risques 
d'erreurs dans la selection des clones empechant toute 
selection speciflque . 

Or, les thioredoxines h interviennent de 
maniere importante chez le ble lors de la germination, 

20 et aussi en reduisant de maniere specifique les 
glutenines et d*autres proteines du grain de ble 
(Kobrehel et al, 1992, Plant Physiol., 99, 919-924). 
Afin d*ameliorer la qualite de la farine de ble, par 
exemple I'etat d * oxydo-reduction de certaines 

25 proteines contenues dans cette farine, on peut 
modifier I'activite des thioredoxines h, au niveau 
genetique, en modifiant les genes des thioredoxines h 
ou en ajoutant de nouvelles copies de ces genes ou 
d*ADN complementaires correspondant a ces genes. 

30 II peut etre aussi envisage de rajouter des 

thioredoxines produites par des microorganismes dans 
des produits a usage alimentaire, ou de les utiliser 
pour supprimer I'eff t antinutritionnel des 
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legumlneuses ou pour inact:iver des t:oxlne8, par 
exemple de venin d'abellles ou de serpents. Dans tous 
ces cas, 11 peut etre necessalre, voire Indlspensabl , 
d'utlllser des ADN complementalres correspondant au 
5 gene de thloredoxine h pour produlre ces protelnes. 

L'homme du metier se trouvalt done confronte a 
une absence de methode flable permettant la selectl n 
dans une banque d*ADN complementalre, de clones codant 
pour les thloredoxlnes h. 

10 Le demandeur s*est done attache a recherch r 

une sonde permettant de selectionner de maniere 
speclfique et flable des clones de thloredoxine h dans 
une banque d'ADN complementalre. 

II a montre qu*ll etait possible d'effectuer 

15 une telle selection en utlllsant une sonde codant pour 
une sequence d*acldes amines composant le site actlf 
des thloredoxlnes . 

II a en outre montre que les thloredoxlnes h d 
bles dur et tendre presentent d*une part une grand 

20 similitude entre el les, mals d* autre part des grandes 
differences de structure prlmalre par rapport aux 
autres thloredoxlnes h de plantes dont les sequenc s 
sont deja connues. 

La presente Invention a pour objet des 

25 protelnes presentant une similitude de sequence d*au 
molns 65% avec la sequence SEQ ID N* 1 sulvante: 
Gly Glu Val lie Ser Val His Ser Leu Glu Gin Trp Thr 
Met Gin lie Glu Glu Ala Asn Ala Ala Lys Lys Leu Val 
Val lie Asp Phe Thr Ala Ser Trp Cys Gly Pro Cys Arg 

30 lie Met Ala Pro lie Phe Ala Asp Leu Ala Lys Lys Phe 
Pro Ala Ala Val Phe Leu Lys Val Asp Val Asp Glu Leu 
Lys Pro lie Ala Glu Gin Phe Ser Val Glu Ala Met Pro 
Thr Ph Leu Phe Met Lys Glu Gly Asp Val Lys Asp Arg 
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Val Val Gly Ala lie Lys Glu Glu Leu Thr Thr Lys Val 
Gly Leu His Ala Ala 

Preferentlellement, de t:elles protelnes 
presentent une similitude avec la sequence SEQ ID N*l 
5 d*au molns 75% et encore plus preferentlellement d'au 
moins 85 %* 

La presente invention a ainsi pour objet la 
thioredoxine h de ble tendre presentant la sequence 
SEQ ID N*3 suivante: 

10 
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d'une de ces proteines font aussl partie de la 
presente invention . 

La presente invention a en outre pour objet d s 
fragments d'ADN codant pour une de ces proteines ou un 
5 de ces peptides et en particulier un fragment codant 
pour la thioredoxine h de ble tendre comprenant la 
sequence SEQ ID N'2 suivante: 

ATGGCGGCGT CGGCGGCGAC GGCGAC6GCG ACGGCGGCGG CGGTA6GGGC 
GGGGGAGGTG ATCTCCGTCC ACAGCCTGGA GCA6T66ACC AT6CA6ATCG 

10 AGGAGGCCAA CGCCGCCAAG AAGCTG6TGG TGATTGACTT CACTGCATCA 
TGGTGCGGAC CATGCCGCAT TATGGCTCCA ATTTTCGCTG ATCTCGCCAA 
GAAGTTCCCA GCTGCTGTTT TCCTCAAGGT CGACGTTGAT GAACTGAAGC 
CCATTGCTGA GCAATTCAGC GTGGAGGCCA TGCCAACCTT CCTGTTCATG 
AAGGAAGGAG ATGTCAAGGA CAGGGTTGTC GGAGCTATCA AGGAGGAACT 

15 GAC6ACCAAG GTTGGGCTAC ACGCGGCCCA GTAA 

et un fragment codant pour la thioredoxine de ble dur 
comprenant la sequence SEQ ID N'4 suivante : 
ATGGCGGCGG CGGCGACGGC GACGACTACA GCGGCGGCGA CGGCGGCGGC 
GGTGGGGCCG GGGGAGGTGA TCTCCGTCCA CAGCCTGGAG CAGTGGACCA 

20 TGCAGATCGA GGAG6CCAAC GCCGCCAAGA AGCTGGTGGT GATTGACTTC 
ACTGCATCAT GGT6CGGACC ATGCCGCATC ATGGCTCCAA TTTTTGCTGA 
TCTCGCCAAG AAGTTCCCAG CTGCTGTTTT CCTCAAGGTC GACGTTGATG 
AACTGAAGCC CATTGCT6AG CAATTCA6CG TCGAG6CCAT GCCAACCTTC 
CTGTTCAT6A AGGAAGGA6A CGTCAAG6AC AGGGTTGTCG GA6CTATCAA 

25 GGAGGAGCTG ACGACCAAGG TTGGGCTCCA CGCGGCT6CC TAG 

Elle a aussi pour objet une methode de 
selection dans une banque d'ADN complementaire de 
clones codant pour une thioredoxine h caracterisee en 
ce qu'on hybride lesdits clones avec une sonde 

30 presentant une similitude de sequences proche de 100% 
avec le site actif des thioredoxines . 

Avantageusem nt, une tell sond pr'sent la 
sequence suivante : (SEQ ID N* 6) 
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TGGTGX1GGX2CCX3TGX4AAX5ATG 
dans laquelle : 

Xj represente C ou T 

X2 represente T ou A 
5 X3 represente G, C ou T 

X4 represente C ou T 

X5 represente G ou A 

On remarquera, comme le montrent les 
comparaisons effectuees dans les exemples qui suivent 

10 , que les thloredoxines h de ble presentent une grande 
difference de structure prlmalre par rapport aux 
thloredoxines h de plantes deja connues . 

II n'etait done en rien evident pour I'homme du 
metier de deduire les sequences de ces thloredoxines h 

15 de ble des sequences d'autres thloredoxines h 
divulguees dans I'etat de la technique- 

En outre, I'obtention d'ADN complementaires 
(ADNc) pour un gene donne n'est pas, malgre les 
developpements recents dans les techniques de biologie 

20 moleculaire, une technique de routine • 

En effet, I'obtention d'un ADNc particulier 
necessite la mise au point d'un procede specif ique qui 
va bien au-dela d'une simple adaptation d'une 
technique- En particulier le choix du materiel dont 

25 sont extraits les ARN messagers est essentiel . Cette 
specif icite est d'autant renforcee que les ARN 
messagers sont en faibles quantites ce qui est le cas 
de la presente invention. 

On notera de plus que 1 ' utilisation 

30 d' oligonucleotides degeneres pour cribler les ADN 
complementaires n'avait jamais ete mise en oeuvre dans 
le cas des thioredoxin s h . II n'etait en rien 
evid nt qu'une t lie utilisation permette un criblag 
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ef flcace . 

Le ble est une gramlnee d ' un polds economlque 
considerable et son amelioration, alnsl que celle d 
ses produits en utlllsant les thloredoxlnes h ou d s 
5 fragments d'ADN codant pour ces proteines, constituent 
des progres techniques importants . 

La presente Invention est de plus relative a 
des vecteurs d' expression portant un fragment d'ADN 
tel que defini ci-dessus, et en particuller portant au 
10 moins une partie de la sequence SEQ ID N*2 ou de la 
sequence SEQ ID N*4 decrites ci-dessus. 

De tels vecteurs comprennent au moins : 

- une origine de replication adaptee a l*espece 
biologique, microorganisme ou autre, dans laquelle on 

15 souhaite reproduire le vecteur; 

- un promoteur situe en amont du fragment d'ADN 
, adapte a I'espece biologique dans laquelle on 
souhaite exprimer les proteines selon 1 'invention - 

lis peuvent aussi comprendre des sequences de 
20 regulation de 1' expression du promoteur. Ce promoteur 
peut etre soumis a regulation selon les conditions de 
culture des microorganismes . 

De tels vecteurs peuvent etre particulierement 
des vecteurs de secretion, ou d' excretion* 
25 De maniere avantageuse, les fragments d'ADN 

definis ci-dessus sont integres dans un plasmide, et 
en particuller dans le plasmide pET commercialise par 
Novagen (USA) . 

Des vecteurs pETtrxTa et pFL61trxTa portant la 
30 sequence identifiee ci-dessus SEQ ID N*2 ont ete 
deposes respect iveraent sous les numeros 1-1442 et I- 
1443 aupres de la Collection National de Cultures d 
Microorganismes de 1 ' Institut Pasteur ( CNCM) . 
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D'autres objet.s de la presente lnvent.ion sont 
des mlcroorganismes , des cellules eucaryotes, et en 
particulier des cellules vegetales ou animales, et des 
plantes transgenlgues portant une des sequences 
5 deflnles ci-dessus. Un tel microorganisme est 
avantageusement une bacterle, telle que E. coll ou une 
corynebacterle, une levure ou un champignon 
f llamenteux. Des cellules anlmales peuvent etre, par 
exemple, des cellules d*insectes* 
10 Les especes blologlques portant ces fragments 

et/ou vecteurs sent cholsies afin de permettre une 
expression des protelnes selon 1' invention. 

Enfln, la presente invention est relative a un 
procede de production des protelnes selon 1' invention/ 
15 et en particulier de thioredoxines h, comprenant les 
etapes suivantes : 

- culture d*un microorganisme tel que defini 
ci-dessus, et 

isolement des protelnes ou peptides selon 
20 1* invention produits par ledit microorganisme. 

Le present procede n'est pas limite a 
I'obtention de derives de thioredoxines h de ble. II 
peut aussi etre applique a la production de 
thioredoxines h d'autres cereales telles que le mais, 
25 I'orge, le seigle, le sorgho ou le riz, de 
legumineuses telles que le soja, 1' haricot ou le pois 
ou d'oleagineux tels que le tournesol, le chanvre, le 
lin ou le colza, ou de derives de ces thioredoxines h, 
a I'aide de vecteurs portant des sequences codant pour 
30 ces protelnes. 

Avantageusement/ les microorganismes sont lyses 
apres culture et les protelnes selon 1' invention sont 
recuperees par des methodes connues de 1 ' homme du 
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metier. 

li'homme du metier pourra se referer^ si 
necessaire, pour la preparation des proteines selon 
1' invention, de leurs vecteurs ou de microorganismes 
5 portant ces vecteurs, et de maniere generale pour la 
mise en oeuvre de la presents invention au manuel 
suivant : Maniatis et al. Molecular cloning : A 
Laboratory Manual , Cold Spring Harbor Laboratory 1982 
ou a une de ses recentes reeditions • 

10 Les proteines objets de la presente invention 

ou pouvant etre obtenues selon un precede objet de la 
presente invention peuvent etre utilisees dans de 
nombreuses applications, en particulier, comme 
additifs dans des produits a usage alimentalre ou non 

15 alimentalre, pour la suppression de I'effet 
antinutritionnel des legumineuses , pour 1 • inactivation 
de diverses toxines en particulier celles de venin 
d'abeilles et de serpents. 

Ces applications et d'autres applications sont 

20 repertoriees dans la demande PCT/US 92/08 595 dont le 
contenu est integre a la presente demande par 
reference . 

La production de thioredoxine h de ble dans la 
levure, en particulier Saccharomyces cerevisiae, 

25 permet de I'utiliser directement dans les produits 
alimentaires sous forme de levures enrichies en 
thioredoxine h (par induction de 1' expression du gene 
ou par accumulation de la thioredoxine h dans la 
levure), sous forme lyophilisee par exemple. 

30 Le fait d'obtenir des thioredoxines h de ble 

par le precede selon 1' invention permet de les ajouter 
a un produit consomme par les humains tout n leur 
cons rvant 1 ur caractere naturel . 
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La presente invention permet en outre d'obtenlr 
de la thioredoxine h de ble en quantite importante 
(par rapport a une purification a partir de ble) par 
exemple a partir de cultures de bacteries ou de 
5 levures et d'ajouter cette thioredoxine h, apres 
purification ou en utilisant des levures enrichies 
( surexprimant la thioredoxine h) , a des produits 
cerealiers en vue d'ameliorer leur valeur 
d'utilisation. 

10 Le fait de disposer des sequences codant pour 

les thioredoxines h de bles dur ou tendre permet de 
les modifier par mutagenese dirigee et d'obtenir des 
thioredoxines h dont les proprietes sont modifiees, et 
en particulier dont I'activite est amelioree par 

15 rapport a celle de la thioredoxine h isolee du ble. 

La presente invention est illustree sans pour 
autant etre limitee par les exemples qui suivent dans 
lesquels : 

La figure 1 illustre les differences de 
20 sequences des thioredoxines h de ble tendre 
(THIOBLETA) de ble dur (THIOBLETD) , de riz (THIORIZ), 
d'Arabidobsis (THIOARA) , de thioredoxine h2 de tabac 
(THIOTABAC2) , de thioredoxine hi de tabac (THIOTABAC) 
et de Chlamydomonas reinhardtii (THIOCHLA) • 
25 La figure 2 illustre la construction du 

plasmide pETtrxTa . 

Les figures 3 et 4 representent respectivement 
un gel de polyacrylamide-SDS apres coloration au bleu 
de Coomassie et un Western-blot effectue avec un 
30 anticorps dirige centre la thioredoxine h de ble de : 

1. lysat de bacteries avant induction, 

2 . culot des proteines insolubles du lysat 
apres 3h d' induction. 
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3. culot apres chauffage des protelnes solubles 
du lysat., 

4. surnageant apres chauffage des protelnes 
solubles du lysat, 

5 5. comine 2 apres 6h d' induction, 

6. comme 3 apres 6h d" induction/ 
7* comme 4 apres 6h d* induction, 

Les figures 5 et 6 representent schematiquement 
les plasmides pFL61 et pVT-U 100. 
10 EXEMPLE 1; Obtention de clones de thloredoxine h d 
ble tendre 

1 • ) Construction de la banaue d'ADN 
complementaire f ADNc) . 

L* extraction des ARN totaux de graines et la 
15 selection des ARN poly (A)"*" ont ete effectuees comme 
decrit par Gautier et al. ( Plant Mol Biol., 14, 313- 
322, 1990). 

5/ig d'ARN poly (A)**" issus de graines de 
Triticum aestivum L., variete capitole en cours de 

20 maturation (23 jours apres floraison ) ont ete 
utilises pour construire une banque d'ADN 
complementaire, en utilisant le Systeme Superscript 
Plasmid commercialise par BRL. 

Les ADN complementaires presentant une taille 

25 superieure a 500 pb sont ligues au plasmide pSPORTl 
commercialise par BRL coupe par les enzymes Notl-Sall, 
qui est utilise pour transformer des cellules 
d' Escherichia coli DHSa. 

2.10^ bacteries recombinantes sont obtenues 

30 avant amplification de la banque. Environ 3000 
recombinants sont etales et les colonies sont 
transferees sur une m mbrane Hybond C (Am rsham) selon 
les instructions du fabricant. 
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2 ' ) Isolement d'un clone codant pour une 
-bhioredoxine h de ble tendre. 

La banque d'ADN complementalre obtenue en 1*) 
est criblee a I'aide d*un melange d * oligonucleotides 
5 de synthese presentant la sequence ID N* 6 suivante : 
TGGTGX^GGX2CCX3TGX4AAX5AT6 
dans laquelle : 

X^ represente C ou T 

X2 represente T ou A 
10 X3 represente A, 6, C ou T 

X4 represente C ou T 

Xg represente G ou A 

Un melange contenant ces oligonucleotides 
synthetiques marques a leurs extremites 5* par du 
15 gamma-^^P ATP a l*aide de la polynucleotide kinase T4 
a ete utilise. 

Les f litres ont ete prehybrides (16 heures , 
37 *C) et hybrides (4 heures, 37 *C) dans une solution 
comprenant 15% (v/v) de formamide desionise, SSPE 2 X, 
20 solution de Denhardt 5 X, SDS 1 % (poids /volume) et 
de I'ADN de sperme de saumon denature (200 pg/ml), 

Les filtres hybrides sont laves deux fois dans 
du SSPE 2 X et du SDS 0,1 % ( poids/volume) durant 10 
minutes a temperature ambiante; puis deux fois dans 
25 du SSPE 0,25 X, et du SDS 0,1 % (poids/volume) durant 
30 minutes a 37 *C puis une fois dans du SSPE 0,25 X 
durant 10 minutes a 37 *C. 

lis sont ensuite exposes a des films sensibles 
aux rayons X ( Fuji ) a -70 *C avec deux ecrans 
30 intensif iants • 

Un clone, appele pTaM1338, est isole et sa 
sequence st d'termin'e sur 1 s deux brins en 
utilisant la trouss de sequengage Taq Dye Deoxy 
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Terminator Cycle Sequencing kit commercialise par 
Applied Biosystems et le sequenceur 370 DNA 
automatique commercialise par Applied Biosystems. 

La sequence de 1*ADN complementaire du clon 
5 pTaM1338 est la suivante : 
(SEQ ID N'7) 

CAAA6TGCGC 6TGAGAAATA AGCGGTGCTT GCCCAGTAGA GAGAGAGAGA 
10 GAGAGAGAGA GAGATG6CGG CGTCGGCGGC GACGGCGACG GCGAC6GC66 

CGGCGGTAGG GGCGGGGGAG GTGATCTCCG TCCACAGCCT GGAGCAGT66 
ACCATGCAGA TCGAGGAGGC CAACGCCGCC AAGAA6CTGG TGGTGATTGA 
CTTCACTGCA TCATGGTGCG GACCATGCCG CATTATGGCT CCAATTTTCG 
CTGATCTCGC CAAGAAGTTC CCAGCTGCTG TTTTCCTCAA GGTCGACGTT 
15 GATGAACTGA AGCCCATTGC TGAGCAATTC A6CGTGGAGG CCATGCCAAC 

CTTCCTGTTC ATGAA66AAG GAGATGTCAA G6ACAGGGTT GTCGGAGCTA 
TCAAGGAGGA ACTGACGACC AAGGTTGGGC TACACGCGGC CCAGTAATCA 
CCTACCGGAG TAGCATTCGC CTAAATAAAA TTGCC6CTCA ACAAGTA6TG 
CCTCTAATGG CACCTTATAT CCTGT6TACT GCTTGTTACT TGTTGGTTTA 
20 TGGATAATGG TGAATCAAGT GTGACTTTAT TCGGTAAATG GTTGATTTTC 

GTAAGGAGCT GATCGAATTC AGTTGTTCGG CTATAGGCAA AAAAAAAAAA 
AAAAAAAAA 



L'extremite 5* de cette sequence comprend une 
25 sequence de 63 paires de bases (pb) non codante, 
suivie d*une phase de lecture ouverte de 381 pb, puis 
d'une sequence non codante de 215 pb, a l'extremite 
3* . 

La phase de lecture ouverte code pour une 
30 proteine de 127 acides amines de sequence SEQ ID N*2« 

La masse theorique de la proteine codee par 
cette phase de lecture ouverte est de 13524D. 
EXEMPLE 2 : 

Obtention de clone de thioredoxine h de ble dur. 
35 1) Construction de la banoue d'ADN 

complementalre de ble dur. 

La banque est obtenue de manl^re similaire a 
c lie d 1* X mple 1 a l*exception du mat'riel v'g'tal 
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utilise qui est Triticum durum Desf. Variete Agathe. 
Les ARN totaux sont isoles de grains 22 jours apres 
f loraison. 

Les ARN messagers isoles par chromatographie 
5 d'af finite sur oligo dT cellulose sont clones dans le 
plasmide pUCllB dans le site de clonage PstI . 

La souche d ' Escherichia coli JM109 est 
trans formee avec les plasmides obtenus • 

La methode de fabrication de cette banque d'ADN 
10 complementaire est mise en oeuvre de la maniere 
decrite par Gautier et al • (Plant Molecular Biology, 
14, 313-322, 1990) dont la publication est incluse par 
reference a la presente demande. 

2 • Isolement d'un clone codant pour une 
15 thioredoxine h de ble dur, 

Des clones sont cribles comme indique dans 
I'exemple 1 par le meme melange d ' oligonucleotides de 
synthese ( SEQ ID N* 6). 

Un clone, denomme pTdl4132 est isole et sa 
20 sequence est determinee comme indique dans I'exemple 
!• 

Ce clone comprend la sequence d'ADN 
complementaire de ble dur suivante : 

25 SEQ ID N'8 

CGTGAGAAAT AAGCGGTGCT TGCCAAGCAG AGAGAGAGAG AGAGAGAGAG 

ATGGCGGCGG CGGCGACGGC GACGACTACA GCGGCGGCGA CGGCGGCGGC 

GGTGGGGCCG GGGGAGGTGA TCTCCGTCCA CAGCCTGGAG CAGTGGACCA 

30 TGCAGATCGA GGAGGCCAAC GCCGCCAAGA AGCTGGTGGT GATTGACTTC 

ACTGCATCAT GGTGCGGACC ATGCCGCATC ATGGCTCCAA TTTTTGCTGA 

TCTCGCCAAG AAGTTCCCAG CTGCTGTTTT CCTCAAGGTC GACGTTGATG 

AACTGAAGCC CATTGCTGAG CAATTCAGCG TCGAGGCCAT GCCAACCTTC 

CTGTTCATGA AGGAAGGAGA CGTCAAGGAC AGGGTTGTCG GAGCTATCAA 
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GGAGGAGCTG ACGACCAAGG TTGGGCTCCA CGCGGCTGCC TAGTAATCAC 
CTAGCGGAGT AGTATTCGCC TAAATAAAAT TGCCGCTTGA GAAGTAGTGC 
CTCCAATGGC ACCGGATATG CTGTGTACTG CTTGCTTCTT GTGAGTTTAT 
GGATGATGGT GAATCAAGTG TGACTTTATT CGGTAAATGG TTGATTTCAT 
5 AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA 

L'extremite 5* de cette sequence comprend une 
partle non codante de 50 bp, puis une phase de lectur 
ouvert:e de 390 pb puis une partle non codante de 190 
pb a son extremlte 3*. 
10 La phase de lecture ouverte correspond a une 

protelne de 130 acldes amines, ayant une masse 
moleculalre theorlgue de 13750D. 
EXEMPLE 3 : 

Comparalson des structures prlmaires des thloredoxines 
15 h de bles dur et tendre et des autres thloredoxines h 
dlvulauees dans I'etat de la technique > 

Les structures prlmaires des deux protelnes 
correspondant aux clones pTaM1338 et pTdl4132 ont ete 
comparees entre el les et aux structures prlmaires de 
20 thloredoxines h de rlz ( THIORIZ), de thloredoxlne h 
d' Arabldopsls (THIOARA) , de thloredoxlne h2 de tabac 
(THIOTABAC 2), de thloredoxlne hi de tabac (THIOTABAC) 
et de thloredoxlne h de Chlamydomonas relnhardtll 
(THIOCHLA) • 

25 Les resultats de ces comparalsons sont reprls 

dans la figure 1 • 

Dans cette figure les acldes amines sont 
representes par le code a une lettre et {*) represente 
une position d'aclde amine Identlque dans les sept 
30 protelnes, tandls que (.) represente une position 
d'aclde amine slmilalre. 

Sur une longu ur totale de 138 acldes amines, 
on observe une conservation a 1' Identlque pour 31 
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acides amines (22,5 %) et une slmllarlte pour 42 
acides amines ( 30,4 %)• 

II ressort done clairement de cette figure que 
les thioredoxines h de bles montrent une faible 
5 identite de sequence avec les autres thioredoxines h 
de vegetaux deja sequences. 

De maniere surprenante, 1* identite de sequence 
entre d'une part la thioredoxine h de riz et d' autre 
part les thioredoxines h de ble tendre et de ble dur 
10 n'est que de respectivement 54,9% et 55,7 %, alors que 
ces plantes sont toutes trois des graminees. 
EXEMPLE 4; 

Production de thioredoxine h par des bacteries . 

1, Sous-clonage de la sequence codant pour la 
15 thioredoxine h de ble tendre dans un vecteur 

d'expresslon d'E>coll; 

Le DNA plasmidique pTAM1338 contenant la 

sequence d*ADNc codant pour la thioredoxine h de ble 

tendre (Triticum aestivum) a ete modifie par 
20 mutagenese dirigee pour introduire les sites de 

restriction Ndel et BamHI respectivement en 5 • et 3 • 

de la sequence codant pour la proteine. 

Ces sites de restriction ont ensuite servi a 

introduire la sequence codant pour la thioredoxine h 
25 de ble tendre (Triticum aestivum) dans le vecteur 

d' expression pET3b commercialise par Novagen (USA) et 

decrit par Rosenberg et al., (Gene, 56, 125-135, 1987) 

digere par les memes enzymes. 

La figure 2 illustre cette construction. 
30 Le vecteur pET3b est une molecule d'ADN 

circulaire derive de pBR322; 11 contlent les elements 

suivants : 

- le promoteur du gene 10 reconnu par I'ARN 
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polymerase T7 (appele POlO) contenu entre les sites de 
restriction Bglll et Xbal, 

- la sequence Shlne-Dalgarno du gene 10, 

- un codon d" Initiation ATG contenu dans le 
5 site unique de restriction Ndel en 5* des premiers 

codons du gene 10, 

un site de restriction unique BamHI qui 

permet de doner une sequence d'un gene etranger dans 

le vecteur d ' expression, 
10 - le termlnateur de transcription qui suit 

normalement le gene lO(TO). 

Ce vecteur possede le repllcon pHBl (ori) et 

contient le gene bla qui code pour la resistance a 

I'ampicillne (ampR) . 
15 La sequence codant pour la thioredoxine h d 

ble tendre Incluse entre les sites de restriction Ndel 

et BamHI qui ont ete crees par mutagenese dirlgee est 

Introduite dans le vecteur d* expression digere par les 

memes enzymes . 

20 Le vecteur resultant pETtrxTa est utilise pour 

transformer des souches d'E. coll. 

Les methodes conventionnelles de clonage ont 
ete utllisees. Elles sont decrites par Maniatis et al. 
(19B2). Molecular Cloning: A Laboratory Manual, 2nd 
25 Ed., Cold Spring Harbor Laboratory, New York. 

Le plasmlde pETtrxTa resultant de la 
construction a ete sequence comme decrit par Sanger et 
al. (1977, Proc. Natl. Acad. Sci . USA 74, 5463-5467), 
dans le but de verifier qu'aucune mutation n'a ete 
30 Introduite dans la sequence de la thioredoxine h au 
cours de 1 • amplification ou du clonage. 

La sequence codant pour la thioredoxine h peut 
aussi *tre Introdult dans le vecteur d'expr ssion 
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apres modification, par mutagenese dirigee, d'un ou 
plusieurs acides amines de la proteine dans le but de 
changer ses proprietes . Les methodes conventionnelles 
de mutagenese dlrigee sont decrites par Maniatis et 
5 al, (19 82, precedemment cite), 

2 * Obtention de bacteries produisant de la 
thioredoxine h: 

Le vecteur pETtrxTa qui contient la sequence 
codant pour la thioredoxine h de ble sous controle du 

10 promoteur reconnu par I'ARN polymerase du 
bacteriophage T7 est utilise pour transformer des 
souches d'E- coli (Hanahan et al . , 1985, Technique for 
transformation of E. coli in "DNA Cloning: A practical 
Approach "(Glover , D.M.Ed. Vol.1, pp 109-135, IRL 

15 Press, Oxford), capables de synthetiser I'ARN 
polymerase T7 . De telles souches sont commercialisees 
par Novagen (USA) et decrites par Studier et al . , 
(1990, Methods Enzymol . 185, 60-89). Elles peuvent 
etre: 

20 -BL21 (DE3): ompT hsdS gal ( lambda clts857 

indl Sam7 nin5 lacUV5-T7 genel), 

-BL21 (DE3)pLysE: meme genotype que BL21 (DE3) 
excepte le plasmide pLysE qui derive du plasmide 
PACYC184 (Chang et al . , 1978 , J.Bacteriol. 134-1141) 

25 et contient le gene codant pour le lysozyme T7 ainsi 
que le gene de resistance au chloramphenicol. Le gene 
codant pour le lysozyme est exprime a partir du 
promoteur tet de pACYC184 ce qui signifie que les 
bacteries qui portent ce plasmide accumulent un taux 

30 important de lysozyme. 

-BL21 {DE3)pLysS: meme genotype que BL21 
(DE3)pLysE mais le gene codant pour le lysozyme est 
insere dans I'orl ntation opposee. En consequ nee, les 
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bacteries qui portent ce plasmide accumulent un 
quantlte beaucoup plus falble de lysozyme. 

Les bacteries trans formees sont multlpllees 
dans le milieu de Lurla-Bertanl avec les antlblotlques 
5 necessalres/ a 30*C» 

3 > Analyse de 1' expression de la thloredoxlne h 
dans les bacteries, 

Les bacteries contenant le vecteur pETtrxTa 
sont cultlvees jusqu'a une densite optique comprise 
10 entre 0,3 et 0,6 a 600 nm, (une fraction aliquote 
avant induction est conservee pour analyse) • 
L'inducteur de 1' expression de I'ARN polymerase T7 
(IPTG 0.1 mM) est alors ajoute au milieu de culture 
pour permettre 1' expression de la thloredoxlne h et 
15 les bacteries sont collectees par centrif ugation apres 
3 ou 6 h d' induction. 

Les bacteries induites sont lysees par les 
methodes conventionnelles et le lysat contenant les 
proteines totales est centrifuge pour separer la 
20 fraction "proteines insolubles'* (culot) de celle des 
"proteines solubles*' ( surnageant) . 

Le surnageant qui contient I'activit' 
thloredoxlne h, identifiee par dosage de la reduction 
de la malate deshydrogenase comparable au temoin 
25 extrait de ble, est chauffe a 60'C (5 min.) et 
centrifuge pour separer la fraction des proteines 
thermostables (surnageant) des autres proteines. 

Les echantillons des differentes fractions sont 
traites avec le tampon de charge de Laemlli (Laemlli, 
30 1970, Nature, 227, 680-685), chauffe 5 a 10 minutes 
dans un bain marie bouillant et analyse par gel de 
sodium dodecyl sulf ate-polyacrylamide . 

Une proteine de la taille att ndue pour une 
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thloredoxlne h de ble est: presente dans le lysat des 
proteines totales de bacteries induites et rest:e 
soluble meme apres chauffage a 60*C; le meme gel est 
trans fere sur une membrane de nitrocellulose (Towbin 
5 et al., 1979, Proc. Natl. Acad. Sci. USA 76, 435P- 
4 354)/ et incube avec un anticorps dirlge centre la 
thloredoxlne h de ble. La proteine, de taille 
attendue, synthetlsee dans le cytoplasme bacterien 
apres induction, reagit avec 1* anticorps. 

10 Les figures 3 et 4 representent respect ivement 

un gel de polyacrylamide-SDS apres coloration au bleu 
de Coomassie et un Western-Blot effectue avec un 
anticorps dirige centre la thloredoxlne h de ble, de : 
1. lysat de bacteries avant induction, 

15 2 . culot des proteines insolubles du lysat 

apres 3h d* induction, 

3. culot apres chauffage des proteines solubles 

du lysat, 

4. surnageant apres chauffage des proteines 
20 solubles du lysat, 

5. comme 2 apres 6h d' induction, 

6. comme 3 apres 6h d' induction, 

7. comme 4 apres 6h d' induction. 

4, Purification de la thloredoxlne h de ble. 

25 Les conditions de purification utilisees 

suivent essentiellement le protocole decrit par de 
Lamotte-Guery et al . , ((1991) Eur. J. Biochem. 196, 
287-294). Les bacteries sont recoltees apres induction 
de 4h selon les conditions decrites plus haut et 

30 resuspendues dans un tampon 30 mM Trls/HCl pH 7,9 et 1 
mM EDTA (tampon A), 

Apres un cycle de congelation (- 
20'C) /decongelation les cellules sont lysees avec une 
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presse de French et le lysat ainsl obtenu est 
centrifuge a 30 minutes a 50 OOO g pour recuperer 

la fraction surnageante qui est ensuite chauffee a 
60* C, 5 minutes. 
5 Les proteines denaturees par le traitement a 

chaud sont centrifugees comme precedemment • L 
surnageant contient principalement la thioredoxine h. 
Elle peut etre purifiee par precipitation au sulfate 
d' ammonium (35-80 %) suivie d'une chromatographie 

10 d" exclusion (Sephadex G-50) et d'une chromatographi 
echangeuse d ' ions (Q-Hyper D) . 

Cette dernlere chromatographie est realisee 
avec un gradient de O a 200 mM NaCl, la thioredoxine h 
de ble produite dans E.coli est eluee a une 

15 concentration de 90 mM NaCl . I*a mesure de I'activite 
de la thioredoxine h (mesure de 1' activation de la 
malate deshydrogenase a NADP selon Jacquot et 
al.{(1981). Plant Physiol., 68, 3O0-304) a chaqu 
etape aide a suivre la purification. 

20 EXEMPLE 5 : Production de thioredoxine h par des 
levures . 

1. Construction de pFLSltrxTa; 

Le fragment correspondant a la sequence codante 
de pTaH1388 est amplifie en utilisant deux 
25 oligonucleotides de synthese s'hybridant aux regions 
15-34 et 482-502 et un site de restriction NotI est 
ajoute a chaque extremite. 

Le fragment resultant est insere dans le 
vecteur pFL61 represents sur la figure 5 ( Lacrout , 
30 (1992) Plant J. 2 (3), 417-422) prealablement linearise 
par Notl. 

L sens d' insertion t la sequence sont 
controles. Le vect ur resultant est appele pFL61trxTa. 
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2 . Construction de pVTlJtrxTa; 

La sequence de I'ADNc codant pour la 
thloredoxlne h de ble tendre issue de pTaM1338 est 
isolee apres digestion par BeunHI et Ndel du plasmide 
5 pETtrxTa (plasmide pET portant la sequence codante de 
pTaM1338) puis inseree dans le vecteur pVTUtrxTa 
represents sur la figure 6, (Vernet et al. (1987) Gene 
52, 225-233 ) au niveau du site de clonage Pvu II. Le 
vecteur resultant est appele pVTUtrxTa. 
10 3. Conditions de purification; 

Les levures (souche OLl et YPH 250) sont 
transf ormees par pVTUtrxTa et sont cultivees en milieu 
liquide a 30*C et en conditions selectives, permettant 
le maintien des plasmides dans les cellules jusqu*a 
15 une absorbance a 550 nm de 1, puis sont transferees en 
milieu riche pendant 16 heures • 

Ceci permet d*augmenter la biomasse et le 
faible nombre de divisions ayant lieu pendant cette 
duree de temps limite les effets de perte de plasmide. 
20 Les cellules sont ensuite cassees par passage dans un 
broyeur a billes ou par incubation dans de 
1 'ammoniaque. Les conditions de purification de la 
proteine recombinante a partir du lysat cellulaire 
sont celles decrites par de Lamotte et al . ( (1991). 
25 Eur. J. Biochem. 196, 287-294). 

Les deux souches de levures transf ormees 
produisent des thioredoxines h decelables par 
Immunoempreintes • 

La souche YPH252 deposee a 1*ATCC peut aussi 
30 etre utillsee. 
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LISTE DE SEQUENCES 

(1) INFORMATION GENERALE: 

(1) DEPOSANT: ^^^^^^^^ National de la Recherche Agronomlque 

INRA ^ 

(B) RUE: 147 rue de I'universlte 

(C) VILLE: Paris 

(E) PAYS: France 

(F) CODE POSTAL: 75348 

#i4x TTTPP HE L- INVENTION: Thloredoxines h de ble tendre et de bl6 dur 
(11) TITRE ^^^^Jj;^^^J9^ent^^^ des similitudes; fragments d'ADN 
codant pour ces proteines et proc6des d'obtention 

(lii) NOMBRE DE SEQUENCES: B 

(iv) FORME LISIBLE PAR ORDINATEUR: 

(A) TYPE DE SUPPORT: Floppy disk 

(B) ORDINATEUR: IBM PC compatible 

C SYSTEME D' EXPLOITATION: PC"DOS/KS-DOS 

(D) LOGICIEL: Patentin Release #1.0, Version #1.25 (OEB) 

(2) INFOK-IATION POUR LA SEQ ID NO: 1: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 109 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide 

(iii) HYPOTHETIQUE: NON 

(vi) ORIGINE: 

(A) ORGANISME: Triticum aestivum 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 1: 

Gly Glu Val lie Ser Val His Ser Leu Glu Gin Trp Thr Met Gin He 

Glu Glu Ala Asn Ala Ala Lys Lys Leu Val Val He Asp Phe Thr Ala 
20 25 30 

ser Trp Cys Gly Pro Cys Arg He Met Ala Pro He Phe Ala Asp Leu 
3 5 40 ^ ^ 

Ala Lys Lys Phe Pro Ala Ala Val Phe Leu Lys Val Asp Val Asp Glu 
50 55 60 

Leu Lys Pro He Ala Glu Glr. Phe Ser Val Glu Ala Met Pro Thr Phe 
65 70 75 80 
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Leu Phe Met Lys Glu Gly Asp Val Lys Asp Arg Val Val Gly Ala He 
85 90 95 

Lys Glu Glu Leu Thr Thr Lys Val Gly L u His Ala Ala 
100 105 

(2) INFORMATION POUR LA SEQ ID NO: 2: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 384 palres de bases 

(B) TYPE: acide nuclSique 

(C) NOMBRE DE BR2NS: deux 

(D) CONFIGURATION: lindaire 

(11) TYPE DE MOLECULE: ADNc pour ARNm 

(lii) HYPOTHETIQUE : NON 

(vl) ORIGINE: 

(A) ORGANISME: Tritlcum aestlvum 

(ix) CARACTERISTIQUE ADDITIONELLE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 1..381 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 2: 

ATG GCG GCG TCG GCG GCG ACG GCG ACG GCG ACG GCG GCG GCG GTA GGG 4 8 

Met Ala Ala Ser Ala Ala Thr Ala Thr Ala Thr Ala Ala Ala Val Gly 
15 10 15 

GCG GGG GAG GTG ATC TCC GTC CAC AGC CTG GAG CAG TGG ACC ATG CAG 96 
Ala Gly Glu Val He Ser Val His Ser Leu Glu Gin Trp Thr Met Gin 
20 25 30 

ATC GAG GAG GCC AAC GCC GCC AAG AAG CTG GTG GTG ATT GAC TTC ACT 144 
He Glu Glu Ala Asn Ala Ala Lys Lys Leu Val Val He Asp Phe Thr 
35 40 45 

GCA TCA TGG TGC GGA CCA TGC CGC ATT ATG GCT CCA ATT TTC GCT GAT 192 
Ala Ser Trp Cys Gly Pro Cys Arg He Ket Ala Pro He Phe Ala Asp 
50 55 60 

CTC GCC AAG AAG TTC CCA GCT GCT GTT TTC CTC AAG GTC GAC GTT GAT 240 
Leu Ala Lys Lys Phe Pro Ala Ala Val Phe Leu Lys Val Asp Val Asp 
65 70 75 80 

GAA CTG AAG CCC ATT GCT GAG CAA TTC AGC GTG GAG GCC ATG CCA ACC 288 
Glu Leu Lys Pro He Ala Glu Gin Phe Ser Val Glu Ala Met Pro Thr 
85 90 95 

TTC CTG TTC ATG AAG GAA GGA GAT GTC AAG GAC AGO GTT GTC GGA GCT 336 
Phe Leu Phe Ket Lys Glu Gly Asp Val Lys Asp Arg Val Val Gly Ala 
100 105 110 
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ATC AAG GAG GAA CTG ACG ACC AAG GTT GGG CTA CAC GCG GCC CAG 
lie Lys Glu Glu Leu Thr Thr Lys Val Gly Leu His Ala Ala Gin 

120 123 

TAA 

(2) INFORMATION POUR LA SEQ ID NO: 3: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 127 acldes amines 

(B) TYPE: acide amln6 

(D) CONFIGURATION: lin^alre 

(ii) TYPE DE MOLECULE: proteine 



Lia int -I e 

10 15 

;er Val- His Ser Leu Glu Gin Trp Thr Met Gin 
25 30 

aa Ala Lys Lys Leu Val Val He Asp Phe Thr 
40 45 

>ro Cys Arg He Met Ala Pro He Phe Ala Asp 
55 

?ro Ala Ala Val Phe Leu Lys Val Asp Val Asp 

Ma Glu Gin Phe Ser Val Glu Ala Met Pro Thr 
90 95 

3lu Gly Asp val Lys Asp Arg Val Val Gly Ala 
105 

rhr Thr Lys Val Gly Leu His Ala Ala Gin 
120 125 

(2) INFORl-lATION POUR LA SEQ ID NO: 4: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 393 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: deux 

(D) CONFIGURATION: llneaire 

(ii) TYPE DE MOLECULE: ADNc pour ARNm 

(iii) HYPOTHETIQUE: NON 

(vi) ORIGINE: 

(A) ORGANISME: Triticum durum 



381 



384 





(xi) 


DESCRIPTION 


Met 
1 


Ala 


Ala 


Ser 


Ala . 
5 


Ala 


Gly 


Glu 


Val 
20 


He 


He 


Glu 


Glu 
35 


Ala 


Asn 


Ala 


Ser 
50 


Trp 


Cys 


Gly 


Leu 
65 


Ala 


Lys 


Lys 


Phe 


Glu 


Leu 


Lys 


Pro 


He 
85 


Phe 


Leu 


Phe 


Met 
100 


Lys 


He 


Lys 


Glu 
115 


Glu 


Leu 
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(Ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 1..390 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4: 

ATG GCG GCG GCG GCG ACG GCG ACG ACT ACA GCG GCG GCG ACQ GCG GCG 4 8 

kI? A^a Ala Ala Thr Ala Thr Thr Thr Ala Ala Ala Thr Ala Ala 
1 5 10 

rrr r-ra GGG CCG GGG GAG GTG ATC TCC GTC CAC AGC CTG GAG CAG TGG 96 
Ma va? Oly P^o lly Glu Val He Ser Val His Ser Leu Glu Gin Trp 
20 25 J" 

ACC ATG CAG ATC GAG GAG GCC AAC GCC GCC AAG AAG CTG GTG GTG ATT 144 
tS Met Gin lie Glu Glu Ala Asn Ala Ala Lys Lys Leu Val Val He 
35 40 

rAr TTC ACT GCA TCA TGG TGC GGA CCA TGC CGC ATC ATG GCT CCA ATT 192 
ASP T^e 111 ?eJ irp Cys Gly Pro Cys Arg lie Met Ala Pro He 

50 55- " 

TTT GCT GAT CTC GCC AAG AAG TTC CCA GCT GCT GTT TTC CTC AAG GTC 240 
a" asp lIu Ala Lys Lys Phe Pro Ala Ala Val Phe Leu Lys Val 
65 70 '3 

GAC GTT GAT GAA CTG AAG CCC ATT GCT GAG CAA TTC AGC GTC GAG GCC 288 
ASP vll Isl gYU Leu Lys Pro He Ala Glu Gin Phe Ser Val Glu Ala 
8 5 

ATG CCA ACC TTC CTG TTC ATG AAG GAA GGA GAC GTC AAG GAC AGG GTT 336 
Met Pro Thr Leu Phe Met Lys Glu Gly Asp Val Lys Asp Arg Val 

100 

GTC GGA GCT ATC AAG GAG GAG CTG ACG ACC AAG GTT GGG CTC CAC GCG 
Val Gly Ala He Lys Glu Glu Leu Thr Thr Lys Val Gly Leu His Ala 

lie 120 



GCT GCC TAG 
Ala Ala 
130 



384 



393 
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(2) INFORMATION POUR LA SEQ ID NO: 5: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 130 acides amines 

(B) TYPE: aclde amln6 

(D) CONFIGURATION: lineaire 

(11) TYPE DE MOLECULE: protdlne 

(xl) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 5: 

Met Ala Ala Ala Ala Thr Ala Thr Thr Thr Ala Ala Ala Thr Ala Ala 
15 10 15 

Ala Val Gly Pro Gly Glu Val He Ser Val His Ser Leu Glu Gin Trp 
20 25 30 

Thr Met Gin He Glu Glu Ala Asn Ala Ala Lys Lys Leu Val Val He 
35 40 45 

Asp Phe Thr Ala Ser Trp Cys Gly Pro Cys Arg He Met Ala Pro He 
50 55 60 

Phe Ala Asp Leu Ala Lys Lys Phe Pro Ala Ala Val Phe Leu Lys Val 
65 70 75 80 

Asp Val Asp Glu Leu Lys Pro He Ala Glu Gin Phe Ser Val Glu Ala 
85 90 95 

Met Pro Thr Phe Leu Phe Met Lys Glu Gly Asp Val Lys Asp Arg Val 
100 105 110 

Val Gly Ala He Lys Glu Glu Leu Thr Thr Lys Val Gly Leu His Ala 
115 120 125 

Ala Ala 
130 

(2) INFORI-IATION POUR LA SEQ ID NO: 6: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: un 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) HYPOTHETIQUE: NON 

(V) TYPE DU FRAGMENT: interne 

(ix) CARACTERISTIQUE ADDITIONELLE : 
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(A) NOM/CLE: variation 

(B) EMPLACEMENT: remplace(6, "t") 

(ix) CARACTERISTIQUE ADDITIONELLE : 

(A) NOM/CLE: variation 

(B) EMPLACEMENT: rempXace(9, "a") 

(Ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE: mutation 

(B) EMPLACEMENT: remplace ( 12 , "g") 

(Ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE: mutation 

(B) EMPLACEMENT: remplace(12, "c") 

(Ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE: mutation 

(B) EMPLACEMENT: remplflce(12, "t") 

(ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE: mutation 

(B) EMPLACEMENT: remplace ( 15 , "t") 

(ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE: mutation 

(B) EMPLACEMENT: remplace (18, "a") 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 6: 
TGGTGCGGTC CATGCAAGAT G 
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(2) INFORMATION POUR LA SEQ ID NO: 7: 

(1) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 659 palres de bases 

(B) TYPE: acide nuclSique 

(C) NOMBRE DE BRINS: deux 

(D) CONFIGURATION: linealre 

(11) TYPE DE MOLECULE: ADNC pour ARNm 

(Hi) HYPOTHETIQUE: NON 

(vi) ORIGINE: 

(A) ORGANISME: Triticum aestilvum 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 7: 

CAAAGTGCGC GTGAGAAATA AGCGGTGCTT GCCCAGTAGA GAGAGAGAGA GAGAGAGAGA 60 

GAGATGGCGG CGTCGGCGGC GACGGdGACG GCGACGGCGG CGGCGGTAGG GGCGGGGGAG 120 

GTGATCTCCG TCCACAGCCT GGAGCAGTGG ACCATGCAGA TCGAGGAGGC CAACGCCGCC 180 

AAGAAGCTGG TGGTGATTGA CTTCACTGCA TCATGGTGCG GACCATGCCG CATTATGGCT 240 

CCAATTTTCG CTGATCTCGC CAAGAAGTTC CCAGCTGCTG TTTTCCTCAA GGTCGACGTT 300 

GATGAACTGA AGCCCATTGC TGAGCAATTC AGCGTGGAGG CCATGCCAAC CTTCCTGTTC 360 

ATGAAGGAAG GAGATGTCAA GGACAGGGTT GTCGGAGCTA TCAAGGAGGA ACTGACGACC 420 

AAGGTTGGGC TACACGCGGC CCAGTAATCA CCTACCGGAG TAGCATTCGC CTAAATAAAA 4 80 

TTGCCGCTCA ACAAGTAGTG CCTCTAATGG CACCTTATAT CCTGTGTACT GCTTGTTACT 540 

TGTTGGTTTA TGGATAATGG TGAATCAAGT GTGACTTTAT TCGGTAAATG GTTGATTTTC 600 

GTAAGGAGCT GATCGAATTC AGTTGTTCGG CTATAGGCAA AAAAAAAAAA AAAAAAAAA 659 
(2) INFOR:-3ATION POUR LA SEQ ID NO: 8: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 630 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: deux 

(D) CONFIGURATION: ilneaire 

(ii) TYPE DE MOLECULE: ADNc pour ARNm 

(iii) HYPOTHETIQUE: NON 

(vi) ORIGINE: 

(A) ORGANISME: Triticum durum 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 8: 



CGTGAGAAAT 


AAGCGGTGCT 


TGCCAAGCAG 


AGAGAGAGAG 


AGAGAGAGAG 


ATGGCGGCGG 


60 


CGGCGACGGC 


GACGACTACA 


GCGGCGGCGA 


CGGCGGCGGC 


GGTGGGGCCG 


GGGGAGGTGA 


120 


TCTCCGTCCA 


CAGCCTGGAG 


CAGTGGACCA 


TGCAGATCGA 


GGAGGCCAAC 


GCCGCCAAGA 


180 


AGCTGGTGGT. 


GATTGACTTC 


ACTGCATCAT 


GGTGCGGACC 


ATGCCGCATC 


ATGGCTCCAA 


240 


TTTTTGCTGA 


TCTCGCCAAG 


AAGTTCCCAG 


CTGCTGTTTT 


CCTCAAGGTC 


GACGTTGATG 


300 


AACTGAAGCC 


CATTGCTGAG 


CAATTCAGCG 


TCGAGGCCAT 


GCCAACCTTC 


CTGTTCATGA 


360 


AGGAAGGAGA 


CGTCAAGGAC 


AGGGTTGTCG 


GAGCTATCAA 


GGAGGAGCTG 


ACGACCAAGG 


420 


TTGGGCTCCA 


CGCGGCTGCC 


TAGTAATCAC 


CTAGCGGAGT 


AGTATTCGCC 


TAAATAAAAT 


480 


TGCCGCTTGA 


GAAGTAGTGC 


CTCCAATGGC 


ACCGGATATG 


CTGTGTACTG 


CTTGCTTCTT 


540 


GTGAGTTTAT 


GGATGATGGT 


GAATCAAGTG 


TGACTTTATT 


CGGTAAATGG 


TTGATTTCAT 


600 


AAAAAAAAAA 


AAAAAAAAAA 


AAAAAAAAAA 








630 
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REVENDICATIONS 
1. Proteine presentant une similitude de 
sequence d'au moins 65% avec la sequence SEQ ID N' 1 
suivante : 

5 



Gly 


Glu 


Val 


He 


Ser 


Val 


His 


Ser 


Leu 


Glu 


Gin 


Trp 


Thr 


Me^ 


Gin 


He 


Glu 


Glu 


Ala 


Asn 


Ala 


Ala 


Lys 


Lys 


Leu 


Val 


Val 


He 


Asp 


Phe 


Thr 


Ala 


Ser 


Trp 


Cys 


Gly 


Pro 


Cys 


Arg 


lie 


Met 


Ala 


Pro 


He 


Phe 


Ala 


Asp 


Leu 


Ala 


Lys 


Lys 


Phe 


Pro 


Ala 


Ala 


Val 


Phe 


Leu 


Lys 


Val 


Asp 


Val 


Asp 


Glu 


Leu 


Lys 


Pro 


He 


Ala 


Glu 


Gin 


Phe 


Ser 


Val 


Glu 


Ala 


Met 


Pro 


Thr 


Phe 


Leu 


Phe 


Met 


Lys 


Glu 


Gly 


Asp 


Val 


Lys 


Asp 


Arg 


Val 


Val 


Gly 


Ala 


He 


Lys 


Glu 


Glu 


Leu 


Thr 


Thr 


Lys 


Val 


Gly 


Leu 


His 


Ala 


Ala 



















15 2. Proteine selon la revendication 1 

caracterisee en ce qu'elle presente une similitude de 
sequence avec la sequence SEQ ID N'l d'au moins 75 % 
et preferentiellement d'au moins 85 %. 

3. Thioredoxine h de ble tendre selon I'une des 

20 revendications 1 et 2 presentant la sequence suivante: 
SEQ ID N'3 



Met 


Ala 


Ala 


Ser 


Ala 


Ala 


Thr 


Ala 


Thr 


Ala 


Thr 


Ala 


Ala 


Ala 


Val 


Gly 


Ala 


Gly 


Glu 


Val 


He 


Ser 


Val 


His 


Ser 


Leu 


Glu 


Gin 


Trp 


Thr 


Met 


Gin 


He 


Glu 


Glu 


Ala 


Asn 


Ala 


Ala 


Lys 


Lys 


Leu 


Val 


Val 


He 


Asp 


Phe 


Thr 


Ala 


Ser 


Trp 


Cys 


Gly 


Pro 


Cys 


Arg 


He 


Met 


Ala 


Pro 


He 


Phe 


Ala 


Asp 


Leu 


Ala 


Lys 


Lys 


Phe 


Pro 


Ala 


Ala 


Val 


Phe 


Leu 


Lys 


Val 


Asp 


Val 


Asp 


Glu 


Leu 


Lys 


Pro 


He 


Ala 


Glu 


Gin 


Phe 


Ser 


Val 


Glu 


Ala 


Met 


Pro 


Thr 


Phe 


Leu 


Phe 


Met 


Lys 


Glu 


Gly 


Asp 


Val 


Lys 


Asp 


Arg 


Val 


Val 


Gly 


Ala 


He 


Lys 


Glu 


Glu 


Leu 


Thr 


Thr 


Lys 


Val 


Gly 


Leu 


His 


Ala 


Ala 


Gin 
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4. Thloredoxlne h de ble dur selon I'une des 
revendications 1 et 2 presentant: la sequence suivante: 
SEQ ID N'5 



Met 


Ala 


Ala 


Ala 


Ala 


Thr 


Ala 


Thr 


Thr 


Thr 


Ala 


Ala 


Ala 


Thr 


Ala 


Ala 


Ala 


Val 


Gly 


Pro 


Gly 


Glu 


Val 


He 


Ser 


Val 


His 


Ser 


Leu 


Glu 


Gin 


Trp 


Thr 


Met 


Gin 


He 


Glu 


Glu 


Ala 


Asn 


Ala 


Ala 


Lys 


Lys 


Leu 


Val 


Val 


He 


Asp 


Phe 


Thr 


Ala 


Ser 


Trp 


Cys 


Gly 


Pro 


Cys 


Arg 


He 


Met 


Ala 


Pro 


He 


Phe 


Ala 


Asp 


Leu 


Ala 


Lys 


Lys 


Phe 


Pro 


Ala 


Ala 


Val 


Phe 


Leu 


Lys 


Val 


Asp 


Val 


Asp 


Glu 


Leu 


Lys 


Pro 


He 


Ala 


Glu 


Gin 


Phe 


Ser 


Val 


Glu 


Ala 


Met 


Pro 


Thr 


Phe 


Leu 


Phe 


Met 


Lys 


Glu 


Gly 


Asp 


Val 


Lys 


Asp 


Arg 


Val 


Val 


Gly 


Ala 


He 


Lys 


Glu 


Glu 


Leu 


Thr 


Thr 


Lys 


Val 


Gly 


Leu 


His 


Ala 


Ala 


Ala 




5 


Peptide 


comprenant 


au 


moins un fragment 



d'une des proteines selon I'une des revendications 1 
et 4. 

6. Fragment d'ADN codant pour une des proteines 
selon I'une quelconque des revendications 1 a 4 ou un 

20 des peptides selon la revendication 5. 

7 . Fragment selon la revendication 6 codant 
pour la thioredoxine h de ble tendre, caracterise en 
ce qu'il comprend la sequence suivante : 

SEQ ID N'2 

25 

ATGGCGGCGT CGGCGGCGAC GGCGACGGCG ACGGCGGCGG CGGTAGGGGC 
GGGGGAGGTG ATCTCCGTCC ACAGCCTGGA GCAGTGGACC ATGCAGATCG 
AGGAGGCCAA CGCCGCCAAG AAGCTGGTGG TGATTGACTT CACTGCATCA 
TGGTGCGGAC CATGCCGCAT TATGGCTCCA ATTTTCGCTG ATCTCGCCAA 
30 GAAGTTCCCA GCTGCTGTTT TCCTCAAGGT CGACGTTGAT GAACTGAAGC 

CCATTGCTGA GCAATTCAGC GTGGAGGCCA TGCCAACCTT CCTGTTCATG 
AAGGAAGGAG ATGTCAAGGA CAGGGTTGTC GGAGCTATCA AGGAGGAACT 
GACGACCAAG GTTGGGCTAC ACGCGGCCCA GTAA 
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8. Fragment selon la revendicatlon 6 codant 
pour la thioredoxlne h de ble dur, caracterlse en ce 
qu'll comprend la sequence sulvante : 

SEQ ID N* 4 

5 

ATGGCGGCGG C6GCGACGGC GACGACTACA GCGGCGGCGA CGGCGGCG6C 
GGTGGGGCCG GGGGAGGTGA TCTCCGTCCA CAGCCTGGAG CAGTGGACCA 
TGCAGATCGA GGAGGCCAAC GCCGCCAAGA AGCTGGTGGT GATTGACTTC 
ACTGCATCAT GGTGCGGACC ATGCCGCATC ATGGCTCCAA TTTTTGCTGA 
10 TCTCGCCAAG AAGTTCCCAG CTGCTGTTTT CCTCAAGGTC GACGTTGATG 
AACTGAAGCC CATTGCTGAG CAATTCAGCG TCGAGGCCAT GCCAACCTTC 
CTGTTCATGA AGGAAGGAGA CGTCAAGGAC AGGGTTGTCG GAGCTATCAA 
GGAGGAGCTG ACGACCAAGG TTGGGCTCCA CGCGGCTGCC TAG 

9 . Vecteur nucleotldique portant un fragment 
15 d'ADN selon I'une des revendications 6 a 8. 

10. Vecteur appele pETtrxTa selon la 
revendicatlon 9 portant la sequence SEQ ID depose 
aupres de la CNCM sous le n* 1-1442. 

11. Vecteur appele pFL61trxTa selon la 
20 revendicatlon 9 portant la sequence SEQ ID N'2/ depose 

aupres de la CNCM sous le n* 1-1443. 

12 • Microorganisme portant un vecteur selon 
I'une des revendications 9a 11. 

13. Microorganisme selon la revendicatlon 12 
25 caracterlse en ce qu'il est une baoterie ou une 

levure . 

14. Methode de selection dans une banque d*ADN 
complementaires de clones codant pour une thioredoxine 
h caracterisee en ce que 1 • on hybride lesdits clones 

30 avec une sonde presentant une similitude de sequences 
proche de 100 % avec le site actif des thioredoxines . 

15. Methode selon la revendicatlon 14 
caracterlse en ce qu ladite sonde pres nte la 
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sequence sulvante : 
SEQ ID N*6 

TGGTGX1GGX2CCX3TGX4AAX5ATG 
dans 1 aque lie : 
5 represente C ou T 

X2 represente T ou A 

X3 represente A, G, C ou T 

X^ represente C ou T 

X5 represente G ou A 
10 16. Precede de production de proteines et de 

peptides selon I'une des revendications 1 a 5 , et en 
particulier de thioredoxines h comprenant les etapes 
suivantes : 

- culture d'un microorganisme selon I'une des 
15 revendications 12 et 13 , et 

isolement des proteines ou peptides selon 
I'une des revendications 1 a 5 produits par ledit 
microorganisme . 

17. Precede selon la revendication 16 
20 caracterise en ce que les microorganismes sont lyses 

apres culture. 

18. Plante transgenique caracterisee en ce 
qu'elle porte un fragment d'ADN selon I'une des 
revendications 6 a 8. 

25 
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THIOBLETA MAASAA TATATAAAVGAGEVISVHSLEQWTMQIEEANAAKKLWIDFTASWC 52 

THIOBLETD MAAAATATTTAAATAAAVGPGEVISVHSLEQWTMQIEEANAAKKLWIDFTASWC 55 

THIORIZ MAA EE GWIACHNKDEFDAQMTKAKEAGKWI IDFTASWC 4 0 

TH lOARA MA SEE GQVI ACHTVETWNEQLQKANESKTLNATVDFTASWC 4 0 

TH I OTAB AC 2 MA EE GQV I G VH TVD AWNEHLQKG I DDKKL I WDFTA S WC 3 9 

THIOTABAC MAANDATSSEE GQVFGCHKVEEWNEYFKKGVETKKLVWDFTASWC 4 6 

THIOCHLA GGSVIVIDSKAAWDAQLAKGKEEHKPIWDFTATWC 36 

** ****** 



THIOBLETA 

THIOBLETD 

THIORIZ 

THIOARA 

THIOTABAC2 

THIOTABAC 

THIOCHLA 



GPCRIMAPIFADLAKKFPA-AVFLKVDVDELKPIAEQFSVEAMPTFLFMKEGDVK 106 

GPCRIMAPIFADLAKKFPA-AVFLKVDVDELKPIAEQFSVEAMPTFLFMKEGDVK 109 

GPCRFIAPVFAEYAKKFPG-AVFLKVDVDELKEVAEKYNVEAMPTFLFIKDGAEA 94 

GPCRFIAPFFADLAKKLPN-VLFLKVDTDELKSVASDWAIQAMPTFMFLKEGKIL 94 

GPCKFIASFYAELAKKMPT-VTFLKVDVDELKSVATDWAVEAMPTFMFLKEGKIV 93 

GPCRFIAPILADIAKKMPH-VIFLKVDVDELKTVSAEWSVEAMPTFVFIKDGKEV 100 

GPCKMIAPLFETLSNDYAGKVIFLKVDVDAVAAVAEAAGITAMPTFHVYKDGVKA 9 1 



***** 



***** 



THIOBLETA 

THIOBLETD 

THIORIZ 

THIOARA 

THI0TABAC2 

THIOTABAC 

THIOCHLA 



DRWGA I KEELTTKVGLHAAQ 127 

DRWGAIKEELTTKVGLHAAA 130 

DKWG ARKDDLQNTI VKH VGATAA S AS A 122 

DKWGAKKDELQSTIAKHL A 114 

DKWGAKKDELQQTI AKH ISST--S-TA 118 

DRWGAKKEELQQTIVKHAAPA- -TVTA 126 

DDLVGASQDKLKALVAKHAAA 112 

« * * « * * 
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Sah 0.25 



ampR 




cDNA Thio 



A/otI 0.92 



C 



Amplification d'un tragment de 390 pD 
de la methionine initiatrice au codon stop 



J 



BamHI 



Insertion dans le vecteur d'expression pET\ 
entre les sites Nde\ eXBamHl y 



ampR 




EcoRV 0.38 

fiamHI 0.51 

cDNA Trx mature 

^ A/del 0.95 
Pd)! 0 \\\BgM 1 .00 
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e i 235 



pVu II 306 
:coR I 396 
Sac I 402 
:cJ136 I 402 
^sp 718 408 5^3,412 

■^P"'^0^-O^val412 
J(ma 1412 
Xba I 423 



tamHI 417 
spMI 585 
►ml I 709 



CfrlO I 4518 




flMI 1051 

ot I 1253 
stX I 1260 
sc I 1277 
StX I 1280 
ot I 1291 

Hind III 1553 



Xcm I 2481 
Bsg I 2546 



Nco i 2406 
EcoR V 2425 



'Stu I 2177 
Bsp 120 1 2237 
Apa I 2237 
Bsm I 2255 
BstB I 2347 
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